intermediate fine-tuning
1. 普通にpre-train
2. data-richなデータセットで学習
3. fine-tuning
NLP
においては, 結構よく使われる手法らしい by
BeiT